home *** CD-ROM | disk | FTP | other *** search
/ TeX 1995 July / TeX CD-ROM July 1995 (Disc 1)(Walnut Creek)(1995).ISO / dviware / dvidis / pxtopk_orig.web < prev    next >
Text File  |  1990-10-01  |  65KB  |  1,649 lines

  1. % PXtoPK.web
  2. %
  3. %  PXtoPK creates a packed pixel file from a regular pixel file.
  4. %
  5. % Preliminary 0.0 version:  May, 1985
  6. % First release 0.9 version:  8 May 1985
  7. % Updated to new PK standards (2.0) : 25 July 1985
  8. % Updated again to new PK format (2.1) : 15 August 1985
  9. % One_fourth bug fixed (2.2) : 23 January 1985
  10. % Use of i after for i := loop fixed (2.3) 14 November 1987
  11. \def\versiondate{30 November 1987}
  12. %
  13. \font\ninerm=cmr9
  14. \let\mc=\ninerm % medium caps for names like PASCAL
  15. \font\logo=logo10 % font used for the METAFONT logo
  16. \def\MF{{\logo META}\-{\logo FONT}}
  17. \def\PASCAL{{\mc Pascal}}
  18. \def\tamu{Texas A\char38 M}
  19. \def\(#1){} % this is used to make section names sort themselves better
  20. \def\9#1{} % this is used for sort keys in the index
  21. \def\title{PXtoPK}
  22. \def\contentspagenumber{0}
  23. \def\topofcontents{\null
  24.   \def\titlepage{F} % include headline on the contents page
  25.   \def\rheader{\mainfont\hfil \contentspagenumber}
  26.   \vfill
  27.   \centerline{\titlefont The {\ttitlefont PXtoPK} processor}
  28.   \vskip 15pt
  29.   \centerline{(Version 2.3, \versiondate)}
  30.   \vfill}
  31. \def\botofcontents{\vfill
  32.   \centerline{\hsize 5in\baselineskip9pt
  33.     \vbox{\ninerm\noindent
  34.     The preparation of this report
  35.     was supported in part by the National Science
  36.     Foundation under grants IST-8201926 and MCS-8300984,
  37.     and by the System Development Foundation. `\TeX' is a
  38.     trademark of the American Mathematical Society.}}}
  39. \pageno=\contentspagenumber \advance\pageno by 1
  40.  
  41. @* Introduction.
  42. The standard format for the distribution of font raster information for \TeX\
  43. has been \.{PXL} files.  These files are loosely packed, based on a 32-bit
  44. word, and use no forms of compression.  \TeX\ requires dozens of fonts in many
  45. different sizes, with typical installations having hundreds of pixel files
  46. using many megabytes of disk storage.
  47. Distribution of the unwieldy pixel files is also a difficult problem for
  48. microcomputer systems, on which \TeX\ is only just becoming available.
  49. Many boxes of diskettes would be required just to store a basic set of fonts
  50. in three sizes for a three-hundred dot per inch device.
  51. A better format is called for.
  52.  
  53. This program compresses a pixel file into a packed, or \.{PK}, file.
  54. This new format is primarily intended for distribution.  Drivers can be adapted
  55. to read these files, and since pixel files can be converted back and forth
  56. with this program and its companion \.{pktopx}, no information will be lost by
  57. leaving the files in one format or another.
  58.  
  59. @ The |banner| string defined here should be changed whenever \.{PXtoPK}
  60. gets modified.
  61.  
  62. @d banner=='This is PXtoPK, Version 2.3'
  63.          {printed when the program starts}
  64.  
  65. @ This program is written in standard \PASCAL, except where it is necessary
  66. to use extensions; for example, \.{PXtoPK} must read files whose names
  67. are dynamically specified, and that would be impossible in pure \PASCAL.
  68.  
  69. @d othercases == others: {default for cases not listed explicitly}
  70. @d endcases == @+end {follows the default case in an extended |case| statement}
  71. @f othercases == else
  72. @f endcases == end
  73.  
  74. @ Both the input and output come from binary files.  On line interaction
  75. is handled through \PASCAL's standard |input| and |output| files.
  76.  
  77. @d print_ln(#)==write_ln(output,#)
  78. @d print(#)==write(output,#)
  79.  
  80. @p program PXtoPK(input, output);
  81. label @<Labels in the outer block@>@/
  82. const @<Constants in the outer block@>@/
  83. type @<Types in the outer block@>@/
  84. var @<Globals in the outer block@>@/
  85. procedure initialize; {this procedure gets things started properly}
  86.   var i:integer; {loop index for initializations}
  87.   begin print_ln(banner);@/
  88.   @<Set initial values@>@/
  89.   end;
  90.  
  91. @ If the program has to stop prematurely, it goes to the
  92. `|final_end|'.
  93.  
  94. @d final_end=9999 {label for the end of it all}
  95.  
  96. @<Labels...@>=final_end;
  97.  
  98. @ The variable |max_mem_size| should be set to the size of the largest font
  99. that will be downloaded, with a few thousand extra for safety.  100,000 should
  100. be sufficient.
  101. @^system dependancies@>
  102.  
  103. @<Constants...@>=
  104. @!max_mem_size=200000; {the major array used for almost everything.}
  105. @!name_length=80; {maximum length of a file name}
  106. @!terminal_line_length=132; {maximum length of an input line}
  107.  
  108. @ Here are some macros for common programming idioms.
  109.  
  110. @d incr(#) == #:=#+1 {increase a variable by unity}
  111. @d decr(#) == #:=#-1 {decrease a variable by unity}
  112. @d do_nothing == {empty statement}
  113.  
  114. @ It is possible that a malformed pixel file (heaven forbid!) or some other
  115. error might be detected by this program.  Such errors might occur in a deeply
  116. nested procedure, so the procedure called |jump_out| has been added to transfer
  117. to the very end of the program with an error message.
  118.  
  119. @d abort(#)==begin print_ln(' ',#); jump_out; end
  120.  
  121. @p procedure jump_out;
  122. begin goto final_end;
  123. end;
  124.  
  125. @* The character set.
  126. Like all programs written with the  \.{WEB} system, \.{PXtoPK} can be
  127. used with any character set. But it uses ASCII code internally, because
  128. the programming for portable input-output is easier when a fixed internal
  129. code is used.
  130.  
  131. The next few sections of \.{PXtoPK} have therefore been copied from the
  132. analogous ones in the \.{WEB} system routines. They have been considerably
  133. simplified, since \.{PXtoPK} need not deal with the controversial
  134. ASCII codes less than @'40.
  135.  
  136. @<Types...@>=
  137. @!ASCII_code=" ".."~"; {a subrange of the integers}
  138.  
  139. @ The original \PASCAL\ compiler was designed in the late 60s, when six-bit
  140. character sets were common, so it did not make provision for lower case
  141. letters. Nowadays, of course, we need to deal with both upper and lower case
  142. alphabets in a convenient way, especially in a program like \.{PXtoPK}.
  143. So we shall assume that the \PASCAL\ system being used for \.{PXtoPK}
  144. has a character set containing at least the standard visible characters
  145. of ASCII code (|"!"| through |"~"|).
  146.  
  147. Some \PASCAL\ compilers use the original name |char| for the data type
  148. associated with the characters in text files, while other \PASCAL s
  149. consider |char| to be a 64-element subrange of a larger data type that has
  150. some other name.  In order to accommodate this difference, we shall use
  151. the name |text_char| to stand for the data type of the characters in the
  152. output file.  We shall also assume that |text_char| consists of
  153. the elements |chr(first_text_char)| through |chr(last_text_char)|,
  154. inclusive. The following definitions should be adjusted if necessary.
  155. @^system dependencies@>
  156.  
  157. @d text_char == char {the data type of characters in text files}
  158. @d first_text_char=0 {ordinal number of the smallest element of |text_char|}
  159. @d last_text_char=127 {ordinal number of the largest element of |text_char|}
  160.  
  161. @<Types...@>=
  162. @!text_file=packed file of text_char;
  163.  
  164. @ The \.{PXtoPK} processor converts between ASCII code and
  165. the user's external character set by means of arrays |xord| and |xchr|
  166. that are analogous to \PASCAL's |ord| and |chr| functions.
  167.  
  168. @<Globals...@>=
  169. @!xord: array [text_char] of ASCII_code;
  170.   {specifies conversion of input characters}
  171. @!xchr: array [0..255] of text_char;
  172.   {specifies conversion of output characters}
  173.  
  174. @ Under our assumption that the visible characters of standard ASCII are
  175. all present, the following assignment statements initialize the
  176. |xchr| array properly, without needing any system-dependent changes.
  177.  
  178. @<Set init...@>=
  179. for i:=0 to @'37 do xchr[i]:='?';
  180. xchr[@'40]:=' ';
  181. xchr[@'41]:='!';
  182. xchr[@'42]:='"';
  183. xchr[@'43]:='#';
  184. xchr[@'44]:='$';
  185. xchr[@'45]:='%';
  186. xchr[@'46]:='&';
  187. xchr[@'47]:='''';@/
  188. xchr[@'50]:='(';
  189. xchr[@'51]:=')';
  190. xchr[@'52]:='*';
  191. xchr[@'53]:='+';
  192. xchr[@'54]:=',';
  193. xchr[@'55]:='-';
  194. xchr[@'56]:='.';
  195. xchr[@'57]:='/';@/
  196. xchr[@'60]:='0';
  197. xchr[@'61]:='1';
  198. xchr[@'62]:='2';
  199. xchr[@'63]:='3';
  200. xchr[@'64]:='4';
  201. xchr[@'65]:='5';
  202. xchr[@'66]:='6';
  203. xchr[@'67]:='7';@/
  204. xchr[@'70]:='8';
  205. xchr[@'71]:='9';
  206. xchr[@'72]:=':';
  207. xchr[@'73]:=';';
  208. xchr[@'74]:='<';
  209. xchr[@'75]:='=';
  210. xchr[@'76]:='>';
  211. xchr[@'77]:='?';@/
  212. xchr[@'100]:='@@';
  213. xchr[@'101]:='A';
  214. xchr[@'102]:='B';
  215. xchr[@'103]:='C';
  216. xchr[@'104]:='D';
  217. xchr[@'105]:='E';
  218. xchr[@'106]:='F';
  219. xchr[@'107]:='G';@/
  220. xchr[@'110]:='H';
  221. xchr[@'111]:='I';
  222. xchr[@'112]:='J';
  223. xchr[@'113]:='K';
  224. xchr[@'114]:='L';
  225. xchr[@'115]:='M';
  226. xchr[@'116]:='N';
  227. xchr[@'117]:='O';@/
  228. xchr[@'120]:='P';
  229. xchr[@'121]:='Q';
  230. xchr[@'122]:='R';
  231. xchr[@'123]:='S';
  232. xchr[@'124]:='T';
  233. xchr[@'125]:='U';
  234. xchr[@'126]:='V';
  235. xchr[@'127]:='W';@/
  236. xchr[@'130]:='X';
  237. xchr[@'131]:='Y';
  238. xchr[@'132]:='Z';
  239. xchr[@'133]:='[';
  240. xchr[@'134]:='\';
  241. xchr[@'135]:=']';
  242. xchr[@'136]:='^';
  243. xchr[@'137]:='_';@/
  244. xchr[@'140]:='`';
  245. xchr[@'141]:='a';
  246. xchr[@'142]:='b';
  247. xchr[@'143]:='c';
  248. xchr[@'144]:='d';
  249. xchr[@'145]:='e';
  250. xchr[@'146]:='f';
  251. xchr[@'147]:='g';@/
  252. xchr[@'150]:='h';
  253. xchr[@'151]:='i';
  254. xchr[@'152]:='j';
  255. xchr[@'153]:='k';
  256. xchr[@'154]:='l';
  257. xchr[@'155]:='m';
  258. xchr[@'156]:='n';
  259. xchr[@'157]:='o';@/
  260. xchr[@'160]:='p';
  261. xchr[@'161]:='q';
  262. xchr[@'162]:='r';
  263. xchr[@'163]:='s';
  264. xchr[@'164]:='t';
  265. xchr[@'165]:='u';
  266. xchr[@'166]:='v';
  267. xchr[@'167]:='w';@/
  268. xchr[@'170]:='x';
  269. xchr[@'171]:='y';
  270. xchr[@'172]:='z';
  271. xchr[@'173]:='{';
  272. xchr[@'174]:='|';
  273. xchr[@'175]:='}';
  274. xchr[@'176]:='~';
  275. for i:=@'177 to 255 do xchr[i]:='?';
  276.  
  277. @ The following system-independent code makes the |xord| array contain a
  278. suitable inverse to the information in |xchr|.
  279.  
  280. @<Set init...@>=
  281. for i:=first_text_char to last_text_char do xord[chr(i)]:=@'40;
  282. for i:=" " to "~" do xord[xchr[i]]:=i;
  283.  
  284. @* Pixel file format.
  285. A \.{PXL} file is an expanded raster description of a single font at a
  286. particular resolution.  \.{PXL} files are used by many existing
  287. device-driver programs for dot matrix devices.
  288. All words in of \.{PXL} files are in 32-bit format, with the four lower
  289. bits zero on 36-bit machines. The raster information is contained in a
  290. sequence of binary words which record white pixels as zeros and black
  291. pixels as ones.
  292.  
  293. The first word of the \.{PXL} file and the last word contain the \.{PXL
  294. ID} which is currently equal to 1001 (decimal).
  295. This first word is followed by a sequence of raster information words
  296. where each line of pixels in the glyphs is represented by one or more
  297. words of binary information. The number of words used to represent each
  298. row of pixels for any particular glyph is fixed and it is set by the value
  299. of |max_m-min_m+1| for that particular glyph. Each white pixel is represented
  300. by a zero and each black pixel is represented by a one in the corresponding bit
  301. positions (the first 32 only of each word on 36-bit machines).
  302. The unused bit positions
  303. toward the end of each set of words for each row of pixels are filled with
  304. zeros.
  305.  
  306. The font directory follows, occupying a fixed position with respect to the
  307. end of the file (in words 517 through 6 from this end), and assigns 4
  308. words for each of the potential 128 different glyphs that could be
  309. contained in this particular font in the order of their assending ascii
  310. values (not in the order that the glyphs appear in the raster section,
  311. which may be entirely arbitrary). This means that the first four words are
  312. for the ascii zero glyph.  All four words reserved for any missing glyphs
  313. are set to zero.
  314.  
  315. The first word of each glyph's directory information contains the pixel
  316. width in the left half-word (the leftmost 16 bits) and the pixel height in
  317. the right half-word (the next 16 bits). These dimensions are those of the
  318. smallest bounding-box, measured in pixels, and they have nothing
  319. necessarily to do with the width and height figures that appear in the
  320. \.{TFM} file.  The \.{TFM} width, measured in \.{FIXes}, where 1 \.{FIX}
  321. is $1/2^{20}$ times the design size, is listed in the fourth word of the
  322. glyph's directory information.
  323.  
  324. The second word of the glyph's directory information contains the offset
  325. of the glyph's reference point from its upper-left-hand corner of the
  326. bounding box, measured in pixels, with the x-offset in the left half-word
  327. and the y-offset in the right half-word.  These numbers may be negative,
  328. and two's complement representation is used.  Remember that the positive x
  329. direction means `rightward' and positive y is `downward' on the page.
  330.  
  331. The third word of a glyph's directory information contains the number of the
  332. word in this \.{PXL} file where the raster description for this particular
  333. glyph begins, measured from the first word which is numbered zero.
  334. As mentioned earlier, the fourth word of directory information for each
  335. glyph contains the \.{TFM} width.
  336.  
  337. The final five words in the \.{PXL} file contain information relation to
  338. the entire file.
  339. The first of these five words is a checksum which should
  340. match the checksum contained in the \.{TFM} file that \TeX\ used in
  341. reference to this font, although, if this checksum is zero, no validity
  342. checking will be done.
  343. The second of these five words is an integer that is 1000 times the
  344. magnification factor at which this font was produced.
  345. The third word contains the design sige of the font measured in \.{FIXes}
  346. ($2^{-20}$ unmagnified points).
  347. The fourth word contains a pointer to the first word of the font directory.
  348. The fifth and last word of the entire file contains a duplicate of the
  349. \.{PXL} ID as contained in the first word of the file.
  350.  
  351. @d pxl_id=1001 {current version of \.{PXL} format}
  352.  
  353. @* Packed file format.
  354. The packed file format is a compact representation of the data contained in a
  355. \.{GF} file.  The information content is the same, but packed (\.{PK}) files
  356. are almost always less than half the size of their \.{GF} counterparts.  They
  357. are also easier to convert into a raster representation because they do not
  358. have a profusion of \\{paint}, \\{skip}, and \\{new\_row} commands to be
  359. separately interpreted.  In addition, the \.{PK} format expressedly forbids
  360. \&{special} commands within a character.  The minimum bounding box for each
  361. character is explicit in the format, and does not need to be scanned for as in
  362. the \.{GF} format.  Finally, the width and escapement values are combined with
  363. the raster information into character ``packets'', making it simpler in many
  364. cases to process a character.
  365.  
  366. A \.{PK} file is organized as a stream of 8-bit bytes.  At times, these bytes
  367. might be split into 4-bit nybbles or single bits, or combined into multiple
  368. byte parameters.  When bytes are split into smaller pieces, the `first' piece
  369. is always the most significant of the byte.  For instance, the first bit of
  370. a byte is the bit with value 128; the first nybble can be found by dividing
  371. a byte by 16.  Similarly, when bytes are combined into multiple byte
  372. parameters, the first byte is the most significant of the parameter.  If the
  373. parameter is signed, it is represented by two's-complement notation.
  374.  
  375. The set of possible eight-bit values are separated into two sets, those that
  376. introduce a character definition, and those that do not.  The values that
  377. introduce a character definition comprise the range from 0 to 239; byte values
  378. above 239 are interpreted commands.  Bytes which introduce character
  379. definitions are called flag bytes, and various fields within the byte indicate
  380. various things about how the character definition is encoded.  Command bytes
  381. have zero or more parameters, and can never appear within a character
  382. definition or between parameters of another command, where they would be
  383. interpeted as data.
  384.  
  385. A \.{PK} file consists of a preamble, followed by a sequence of one or more
  386. character definitions, followed by a postamble.  The preamble command must
  387. be the first byte in the file, followed immediately by its parameters.
  388. Any number of character definitions may follow, and any command but the
  389. preamble command and the postamble command may occur between character
  390. definitions.  The very last command in the file must be the postamble.
  391.  
  392. @ The packed file format is intended to be easy to read and interpret by
  393. device drivers.  The small size of the file reduces the input/output overhead
  394. each time a font is defined.  For those drivers that load and save each font
  395. file into memory, the small size also helps reduce the memory requirements.
  396. The length of each character packet is specified, allowing the character raster
  397. data to be loaded into memory by simply counting bytes, rather than
  398. interpreting each command; then, each character can be interpreted on a demand
  399. basis.  This also makes it possible for a driver to skip a particular
  400. character quickly if it knows that the character is unused.
  401.  
  402. @ First, the command bytes shall be presented; then the format of the
  403. Character definitions will be defined.  Eight of the possible sixteen
  404. commands (values 240 through 255) are currently defined; the others are
  405. reserved for future extensions.  The commands are listed below.  Each command
  406. is specified by its symbolic name (e.g., \\{pk\_no\_op}), its opcode byte,
  407. and any parameters.  The parameters are followed by a bracketed number
  408. telling how many bytes they occupy, with the number preceded by a plus sign if
  409. it is a signed quantity.  (Four byte quantities are always signed, however.)
  410.  
  411. \yskip\hang|pk_xxx1| 240 |k[1]| |x[k]|.  This command is undefined in general;
  412. it functions as a $(k+2)$-byte \\{no\_op} unless special \.{PK}-reading
  413. programs are being used.  \MF\ generates \\{xxx} commands when encountering
  414. a \&{special} string.  It is recommended that |x| be a string having the form
  415. of a keyword followed by possible parameters relevant to that keyword.
  416.  
  417. \yskip\hang\\{pk\_xxx2} 241 |k[2]| |x[k]|.  Like |pk_xxx1|, but |0<=k<65536|.
  418.  
  419. \yskip\hang\\{pk\_xxx3} 242 |k[3]| |x[k]|.  Like |pk_xxx1|, but
  420. |0<=k<@t$2^{24}$@>|.  \MF\ uses this when sending a \&{special} string whose
  421. length exceeds~255.
  422.  
  423. \yskip\hang\\{pk\_xxx4} 243 |k[4]| |x[k]|.  Like |pk_xxx1|, but |k| can be
  424. ridiculously large; |k| musn't be negative.
  425.  
  426. \yskip\hang|pk_yyy| 244 |y[4]|.  This command is undefined in general; it
  427. functions as a five-byte \\{no\_op} unless special \.{PK} reading programs
  428. are being used.  \MF\ puts |scaled| numbers into |yyy|'s, as a result of
  429. \&{numspecial} commands; the intent is to provide numeric parameters to
  430. \\{xxx} commands that immediately precede.
  431.  
  432. \yskip\hang|pk_post| 245.  Beginning of the postamble.  This command is
  433. followed by enough |pk_no_op| commands to make the file a multiple
  434. of four bytes long.  Zero through three are usual, but any number is
  435. allowed.
  436. This should make the file easy to read on machines which pack four bytes to
  437. a word.
  438.  
  439. \yskip\hang|pk_no_op| 246.  No operation, do nothing.  Any number of
  440. |pk_no_op|'s may appear between \.{PK} commands, but a |pk_no_op| cannot be
  441. inserted between a command and its parameters, between two parameters, or
  442. inside a character definition.
  443.  
  444. \yskip\hang|pk_pre| 247 |i[1]| |k[1]| |x[k]| |ds[4]| |cs[4]| |hppp[4]|
  445. |vppp[4]|.  Preamble command.  Here, |i| is the identification byte of the
  446. file, currently equal to 89.  The string |x| is merely a comment, usually
  447. indicating the source of the \.{PK} file.  The parameters |ds| and |cs| are
  448. the design size of the file in $1/2^{20}$ points, and the checksum of the
  449. file, respectively.  The checksum should match the \.{TFM} file and the
  450. \.{GF} files for this font.  Parameters |hppp| and |vppp| are the ratios
  451. of pixels per point, horizontally and vertically, multiplied by $2^{16}$; they
  452. can be used to correlate the font with specific device resolutions,
  453. magnifications, and ``at sizes''.  Usually, the name of the \.{PK} file is
  454. formed by concatenating the font name (e.g., amr10) with the resolution at
  455. which the font is prepared in pixels per inch multiplied by the magnification
  456. factor, and the letters \.{PK}.  For instance, amr10 at 300 dots per inch
  457. should be named AMR10.300PK; at one thousand dots per inch and magstephalf,
  458. it should be named AMR10.1095PK.
  459.  
  460. @ We put a few of the above opcodes into definitions for symbolic use by
  461. this program.
  462.  
  463. @d pk_id = 89 {the version of \.{PK} file described}
  464. @d pk_xxx1 = 240 {\&{special} commands}
  465. @d pk_yyy = 244 {\&{numspecial} commands}
  466. @d pk_post = 245 {postamble}
  467. @d pk_no_op = 246 {no operation}
  468. @d pk_pre = 247 {preamble}
  469.  
  470. @ The \.{PK} format has two conflicting goals; to pack character raster and
  471. size information as compactly as possible, while retaining ease of translation
  472. into raster and other forms.  A suitable compromise was found in the use of
  473. run-encoding of the raster information.  Instead of packing the individual
  474. bits of the character, we instead count the number of consecutive `black' or
  475. `white' pixels in a horizontal raster row, and then encode this number.  Run
  476. counts are found for each row, from the top of the character to the bottom.
  477. This is essentially the way the \.{GF} format works.
  478. Instead of presenting each row individually, however, let us concatenate all
  479. of the horizontal raster rows into one long string of pixels, and encode this
  480. row.  With knowledge of the width of the bit-map, the original character glyph
  481. can be easily reconstructed.  In addition, we do not need special commands to
  482. mark the end of one row and the beginning of the next.
  483.  
  484. Next, let us put the burden of finding the minimum bounding box on the part
  485. of the font generator, since the characters will usually be used much more
  486. often than they are generated.  The minimum bounding box is the smallest
  487. rectangle which encloses all `black' pixels of a character.  Let us also
  488. eliminate the need for a special end of character marker, by supplying
  489. exactly as many bits as are required to fill the minimum bounding box, from
  490. which the end of the character is implicit.
  491.  
  492. Let us next consider the distribution of the run counts.  Analysis of several
  493. dozen pixel files at 300 dots per inch yields a distribution peaking at four,
  494. falling off slowly until ten, then a bit more steeply until twenty, and then
  495. asymptotically approaching the horizontal.  Thus, the great majority of our
  496. run counts will fit in a four-bit nybble.  The eight-bit byte is attractive for
  497. our run-counts, as it is the standard on many systems; however, the wasted four
  498. bits in the majority of cases seems a high price to pay.  Another possibility
  499. is to use a Huffman-type encoding scheme with a variable number of bits for
  500. each run-count; this was rejected because of the overhead in fetching and
  501. examining individual bits in the file.  Thus, the character raster definitions
  502. in the \.{PK} file format are based on the four-bit nybble.
  503.  
  504. @ The analysis of the pixel files yielded another interesting statistic: fully
  505. 37\char`\%\
  506. of the raster rows were duplicates of the previous row.  Thus, the \.{PK}
  507. format allows the specification of repeat counts, which indicate how many times
  508. a horizontal raster row is to be repeated.  These repeated rows are taken out
  509. of the character glyph before individual rows are concatenated into the long
  510. string of pixels.
  511.  
  512. For elegance, we disallow a run count of zero.  The case of a null raster
  513. description should be gleaned from the character width and height being equal
  514. to zero, and no raster data should be read.  No other zero counts are ever
  515. necessary.  Also, in the absence of repeat counts, the repeat value is set to
  516. be zero (only the original row is sent.)  If a repeat count is seen, it takes
  517. effect on the current row.  The current row is defined as the row on which the
  518. first pixel of the next run count will lie.  The repeat count is set back to
  519. zero when the last pixel in the current row is seen, and the row is sent out.
  520.  
  521. This poses a problem for entirely black and entirely white rows, however.  Let
  522. us say that the current row ends with four white pixels, and then we have five
  523. entirely empty rows, followed by a black pixel at the beginning of the next
  524. row, and the character width is ten pixels.  We would like to use a repeat
  525. count, but there is no legal place to put it.  If we put it before the white
  526. run count, it will apply to the current row.  If we put it after, it applies
  527. to the row with the black pixel at the beginning.  Thus, entirely white or
  528. entirely black repeated rows are always packed as large run counts (in this
  529. case, a white run count of 54) rather than repeat counts.
  530.  
  531. @ Now let us turn our attention to the actual packing of the run counts and
  532. repeat counts into nybbles.  There are only sixteen possible nybble values.
  533. We need to indicate run counts and repeat counts.  Since the run counts are
  534. much more common, we will devote the majority of the nybble values to them.
  535. We therefore indicate a repeat count by a nybble of 14 followed by a packed
  536. number, where a packed number will be explained later.  Since the repeat
  537. count value of one is so common, we indicate a repeat one command by a single
  538. nybble of 15.  A 14 followed by the packed number 1 is still legal for a
  539. repeat one count, however.  The run counts are coded directly as packed
  540. numbers.
  541.  
  542. For packed numbers, therefore, we have the nybble values 0 through 13.  We
  543. need to represent the positive integers up to, say, $2^{31}-1$.  We would
  544. like the more common smaller numbers to take only one or two nybbles, and
  545. the infrequent large numbers to take three or more.  We could therefore
  546. allocate one nybble value to indicate a large run count taking three or more
  547. nybbles.  We do this with the value 0.
  548.  
  549. @ We are left with the values 1 through 13.  We can allocate some of these, say
  550. |dyn_f|, to be one-nybble run counts.
  551. These will work for the run counts |1..dyn_f|.  For subsequent run
  552. counts, we will use a nybble greater than |dyn_f|, followed by a second nybble,
  553. whose value can run from 0 through 15.  Thus, the two-byte nybble values will
  554. run from |dyn_f+1..(13-dyn_f)*16+dyn_f|.  We have our definition of large run
  555. count values now, being all counts greater than |(13-dyn_f)*16+dyn_f|.
  556.  
  557. We can analyze our several dozen pixel files and determine an optimal value of
  558. |dyn_f|, and use this value for all of the characters.  Unfortunately, values
  559. of |dyn_f| that pack small characters well tend to pack the large characters
  560. poorly, and values that pack large characters well are not efficient for the
  561. smaller characters.  Thus, we choose the optimal |dyn_f| on a character basis,
  562. picking the value which will pack each individual character in the smallest
  563. number of nybbles.  Legal values of |dyn_f| run from 0 (with no one-byte run
  564. counts) to 13 (with no two-byte run counts).
  565.  
  566. @ Our only remaining task in the coding of packed numbers is the large run
  567. counts.  We use a scheme suggested by D.~E.~Knuth
  568. @^Knuth, D.~E.@>
  569. which will simply and elegantly represent arbitrarily large values.  The
  570. general scheme to represent an integer |i| is to write its hexadecimal
  571. representation, with leading zeros removed.  Then we count the number of
  572. digits, and prepend one less than that many zeros before the hexadecimal
  573. representation.  Thus, the values from one to fifteen occupy one nybble;
  574. the values sixteen through 255 occupy three, the values 256 through 4095
  575. require five, etc.
  576.  
  577. For our purposes, however, we have already represented the numbers one
  578. through |(13-dyn_f)*16+dyn_f|.  In addition, the one-nybble values have
  579. already been taken by our other commands, which means that only the values
  580. from sixteen up are available to us for long run counts.  Thus, we simply
  581. normalize our long run counts, by subtracting |(13-dyn_f)*16+dyn_f+1| and
  582. adding 16, and then representing the result according to the scheme above.
  583.  
  584. @ The final algorithm for decoding the run counts based on the above scheme
  585. might look like this, assuming a procedure called \\{pk\_nyb} is available
  586. to get the next nybble from the file, and assuming that the global
  587. |repeat_count| indicates whether a row needs to be repeated.  Note that this
  588. routine is recursive, but since a repeat count can never directly follow
  589. another repeat count, it can only be recursive to one level.
  590.  
  591. @p@{ function pk_packed_num : integer ;
  592. var i, j, k : integer ;
  593. begin
  594.    i := get_nyb ;
  595.    if i = 0 then begin
  596.       repeat j := get_nyb ; incr(i) ; until j <> 0 ;
  597.       while i > 0 do begin j := j * 16 + get_nyb ; decr(i) ; end ;
  598.       pk_packed_num := j - 15 + (13-dyn_f)*16 + dyn_f ;
  599.    end else if i <= dyn_f then
  600.       pk_packed_num := i
  601.    else if i < 14 then
  602.       pk_packed_num := (i-dyn_f-1)*16+get_nyb+dyn_f+1
  603.    else begin
  604.       if i = 14 then
  605.          repeat_count := pk_packed_num
  606.       else
  607.          repeat_count := 1 ;
  608.       pk_packed_num := pk_packed_num ;
  609.    end ;
  610. end ; @}
  611.  
  612. @ For low resolution fonts, or characters with `gray' areas, run encoding can
  613. often make the character many times larger.  Therefore, for those characters
  614. that cannot be encoded efficiently with run counts, the \.{PK} format allows
  615. bit-mapping of the characters.  This is indicated by a |dyn_f| value of
  616. 14.  The bits are packed tightly, by concatenating all of the horizontal raster
  617. rows into one long string, and then packing this string eight bits to a byte.
  618. The number of bytes required can be calculated by |(width*height+7) div 8|.
  619. This format should only be used when packing the character by run counts takes
  620. more bytes than this, although, of course, it is legal for any character.
  621. Any extra bits in the last byte should be set to zero.
  622.  
  623. @ At this point, we are ready to introduce the format for a character
  624. descripter.  It consists of three parts: a flag byte, a character preamble,
  625. and the raster data.  The most significant four nybbles of the flag byte
  626. yield the |dyn_f| value for that character.  (Notice that only values of
  627. 0 through 14 are legal for |dyn_f|, with 14 indicating a bit mapped character;
  628. thus, the flag bytes do not conflict with the command bytes, whose upper nybble
  629. is always 15.)  The next bit (with weight 16) indicates whether the first run
  630. count is a black count or a white count, with a one indicating a black count.
  631. For bit-mapped characters, this bit should be set to a zero.  The next bit
  632. (with weight 8) indicates whether certain later parameters (referred to as size
  633. parameters) are given in one-byte or two-byte quantities, with a one indicating
  634. that they are in two-byte quantities.  The last two bits are concatenated on to
  635. the beginning of the length parameter in the character preamble, which will be
  636. explained below.
  637.  
  638. However, if the last three bits of the flag byte are all set (normally
  639. indicating that the size parameters are two-byte values and that a 3 should be
  640. prepended to the length parameter), then a long format of the character
  641. preamble should be used instead of one of the short forms.
  642.  
  643. Therefore, there are three formats for the character preamble, and which one
  644. is used depends on the least significant three bits of the flag byte.  If the
  645. least significant three bits are in the range zero through three, the short
  646. format is used.  If they are in the range four through six, the extended short
  647. format is used.  Otherwise, if the least significant bits are all set, then
  648. the long form of the character preamble is used.  The preamble formats are
  649. explained below.
  650.  
  651. \yskip\hang Short form: |flag[1]| |pl[1]| |cc[1]| |tfm[3]| |dm[1]| |w[1]|
  652. |h[1]| |hoff[+1]| |voff[+1]|.
  653. If this format of the character preamble is used, the above
  654. parameters must all fit in the indicated number of bytes, signed or unsigned
  655. as indicated.  Almost all of the standard \TeX\ font characters fit; the few
  656. exceptions are fonts such as \.{aminch}.
  657.  
  658. \yskip\hang Extended short form: |flag[1]| |pl[2]| |cc[1]| |tfm[3]| |dm[2]|
  659. |w[2]| |h[2]| |hoff[+2]| |voff[+2]|.  Larger characters use this extended
  660. format.
  661.  
  662. \yskip\hang Long form: |flag[1]| |pl[4]| |cc[4]| |tfm[4]| |dx[4]| |dy[4]|
  663. |w[4]| |h[4]| |hoff[4]| |voff[4]|.  This is the general format which
  664. allows all of the
  665. parameters of the \.{GF} file format, including vertical escapement.
  666. \vskip\baselineskip
  667. The |flag| parameter is the flag byte.  The parameter |pl| (packet length)
  668. contains the offset
  669. of the byte following this character descripter, with respect to the beginning
  670. of the |tfm| width parameter.  This is given so a \.{PK} reading program can,
  671. once it has read the flag byte, packet length, and character code (|cc|), skip
  672. over the character by simply reading this many more bytes.  For the two short
  673. forms of the character preamble, the last two bits of the flag byte should be
  674. considered the two most-significant bits of the packet length.  For the short
  675. format, the true packet length might be calculated as |(flag mod 4)*256+pl|;
  676. for the extended format, it might be calculated as |(flag mod 4)*65536+pl|.
  677.  
  678. The |w| parameter is the width and the |h| parameter is the height in pixels
  679. of the minimum bounding box.  The |dx| and |dy| parameters are the horizontal
  680. and vertical escapements, respectively.  In the short formats, |dy| is assumed
  681. to be zero and |dm| is |dy| but in pixels;
  682. in the long format, |dx| and |dy| are both
  683. in pixels multiplied by $2^{16}$.  The |hoff| is the horizontal offset from the
  684. upper left pixel to the reference pixel; the |voff| is the vertical offset.
  685. They are both given in pixels, with right and down being positive.  The
  686. reference pixel is the pixel which occupies the unit square in \MF; the
  687. \MF\ reference point is the lower left hand corner of this pixel.  (See the
  688. example below.)
  689.  
  690. @ \TeX\ requires that all characters which have the same character codes
  691. modulo 256 also have the same |tfm| widths, and escapement values.  The \.{PK}
  692. format does not itself make this a requirement, but in order for the font to
  693. work correctly with the \TeX\ software, this constraint should be observed.
  694. The current version of \TeX\ (1.5) cannot output character codes greater
  695. than 255 anyway.
  696.  
  697. Following the character preamble is the raster information for the
  698. character, packed by run counts or by bits, as indicated by the flag byte.
  699. If the character is packed by run counts and the required number of nybbles
  700. is odd, then the last byte of the raster description should have a zero
  701. for its least significant nybble.
  702.  
  703. @ As an illustration of the \.{PK} format, the character \char4\ from the font
  704. amr10 at 300 dots per inch will be encoded.  This character was chosen
  705. because it illustrates some
  706. of the borderline cases.  The raster for the character looks like this (the
  707. row numbers are chosen for convenience, and are not \MF's row numbers.)
  708.  
  709. \vskip\baselineskip
  710. \centerline{\vbox{\baselineskip=10pt
  711. \halign{\hfil#\quad&&\hfil#\hfil\cr
  712. 0& & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M\cr
  713. 1& & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M\cr
  714. 2& & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M\cr
  715. 3& & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M\cr
  716. 4& & &M&M& & & & & & & & & & & & & & & & &M&M\cr
  717. 5& & &M&M& & & & & & & & & & & & & & & & &M&M\cr
  718. 6& & &M&M& & & & & & & & & & & & & & & & &M&M\cr
  719. 7\cr
  720. 8\cr
  721. 9& & & & &M&M& & & & & & & & & & & & &M&M& & \cr
  722. 10& & & & &M&M& & & & & & & & & & & & &M&M& & \cr
  723. 11& & & & &M&M& & & & & & & & & & & & &M&M& & \cr
  724. 12& & & & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M& & \cr
  725. 13& & & & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M& & \cr
  726. 14& & & & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M& & \cr
  727. 15& & & & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M& & \cr
  728. 16& & & & &M&M& & & & & & & & & & & & &M&M& & \cr
  729. 17& & & & &M&M& & & & & & & & & & & & &M&M& & \cr
  730. 18& & & & &M&M& & & & & & & & & & & & &M&M& & \cr
  731. 19\cr
  732. 20\cr
  733. 21\cr
  734. 22& & &M&M& & & & & & & & & & & & & & & & &M&M\cr
  735. 23& & &M&M& & & & & & & & & & & & & & & & &M&M\cr
  736. 24& & &M&M& & & & & & & & & & & & & & & & &M&M\cr
  737. 25& & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M\cr
  738. 26& & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M\cr
  739. 27& & &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M\cr
  740. 28&*& &M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M&M\cr
  741. &\hphantom{M}&\hphantom{M}\cr
  742. }}}
  743. The width of the minimum bounding box for this character is 20; its height
  744. is 29.  The `*' represents the reference pixel; notice how it lies outside the
  745. minimum bounding box.  The |hoff| value is $-2$, and the |voff| is~28.
  746.  
  747. The first task is to calculate the run counts and repeat counts.  The repeat
  748. counts are placed at the first transition (black to white or white to black)
  749. in a row, and are enclosed in brackets.  White counts are enclosed in
  750. parentheses.  It is relatively easy to generate the counts list:
  751. \vskip\baselineskip
  752. \centerline{82 [2] (16) 2 (42) [2] 2 (12) 2 (4) [3]}
  753. \centerline{16 (4) [2] 2 (12) 2 (62) [2] 2 (16) 82}
  754. \vskip\baselineskip
  755. Note that any duplicated rows that are not all white or all black are removed
  756. before the repeat counts are calculated.  The rows thus removed are rows 5, 6,
  757. 10, 11, 13, 14, 15, 17, 18, 23, and 24.
  758.  
  759. @ The next step in the encoding of this character is to calculate the optimal
  760. value of |dyn_f|.  The details of how this calculation is done are not
  761. important here; suffice it to say that there is a simple algorithm which in one
  762. pass over the count list can determine the best value of |dyn_f|.  For this
  763. character, the optimal value turns out to be 8 (atypically low).  Thus, all
  764. count values less than or equal to 8 are packed in one nybble; those from
  765. nine to $(13-8)*16+8$ or 88 are packed in two nybbles.  The run encoded values
  766. now become (in hex, separated according to the above list):
  767. \vskip\baselineskip
  768. \centerline{\tt D9 E2 97 2 B1 E2 2 93 2 4 E3}
  769. \centerline{\tt 97 4 E2 2 93 2 C5 E2 2 97 D9}
  770. \vskip\baselineskip\noindent
  771. which comes to 36 nybbles, or 18 bytes.  This is shorter than the 73 bytes
  772. required for the bit map, so we use the run count packing.
  773.  
  774. @ The short form of the character preamble is used because all of the
  775. parameters fit in their respective lengths.  The packet length is therefore
  776. 18 bytes for the raster, plus
  777. eight bytes for the character preamble parameters following the character
  778. code, or 26.  The |tfm| width for this character is 640796, or {\tt 9C71C} in
  779. hexadecimal.  The horizontal escapement is 25 pixels.  The flag byte is
  780. 88 hex, indicating the short preamble, the black first count, and the
  781. |dyn_f| value of 8.  The final total character packet, in hexadecimal, is:
  782. \vskip\baselineskip
  783. $$\vbox{\halign{\hfil #\quad&&{\tt #\ }\cr
  784. Flag byte&88\cr
  785. Packet length&1A\cr
  786. Character code&04\cr
  787. |tfm| width&09&C7&1C\cr
  788. Horizontal escapement (pixels)&19\cr
  789. Width of bit map&14\cr
  790. Height of bit map&1D\cr
  791. Horizontal offset (signed)&FE\cr
  792. Vertical offset&1C\cr
  793. Raster data&D9&E2&97\cr
  794. &2B&1E&22\cr
  795. &93&24&E3\cr
  796. &97&4E&22\cr
  797. &93&2C&5E\cr
  798. &22&97&D9\cr}}$$
  799.  
  800. @ This format was written by Tomas Rokicki in August, 1985.
  801.  
  802. @* Input and output.
  803. There are three types of files that this program must deal with---standard
  804. text files, files of integers (pixel files), and files of bytes (packed files.)
  805. For our purposes, we shall consider an eight-bit byte to consist of the
  806. values |0..255|.  If your system does not pack these values to a byte, it is
  807. no major difficulty; you must only insure that the output routine
  808. |pk_byte| converts the value to the appropriate type before sending it to the
  809. file.
  810.  
  811. @<Types...@>=
  812. @!eight_bits=0..255; {packed file byte}
  813. @!word_file=packed file of integer; {for pixel file words}
  814. @!byte_file=packed file of eight_bits ; {for packed file words}
  815. @^system dependancies@>
  816.  
  817. @ @<Glob...@>=
  818. @!pxl_file:word_file; {where the input comes from}
  819. @!pk_file:byte_file;  {where the final output goes}
  820. @^system dependencies@>
  821.  
  822. @ To prepare these files for input, we |reset| them. An extension of
  823. \PASCAL\ is needed in the case of |pxl_file|, since we want to associate
  824. it with external files whose names are specified dynamically (i.e., not
  825. known at compile time). The following code assumes that `|reset(f,s)|'
  826. does this, when |f| is a file variable and |s| is a string variable that
  827. specifies the file name. If |eof(f)| is true immediately after
  828. |reset(f,s)| has acted, we assume that no file named |s| is accessible.
  829. @^system dependencies@>
  830.  
  831. @p procedure open_pxl_file; {prepares to read packed bytes in a |pxl_file|}
  832. begin reset(pxl_file,pxl_name);
  833. eof_pixel:=eof(pxl_file);
  834. end;
  835. @#
  836. procedure open_pk_file; {prepares the output for writing}
  837. begin rewrite(pk_file,pk_name);
  838. end;
  839.  
  840. @ We need a place to store the names of the input and output file, as well
  841. as a character counter for the output file and a line position variable.
  842.  
  843. @<Glob...@>=
  844. @!pxl_name,@!pk_name:packed array[1..name_length] of char; {name of input
  845.     and output files}
  846. @!pk_loc:integer; {how many bytes have we sent?}
  847.  
  848. @ @<Set init...@>=
  849. pk_loc := 0 ;
  850.  
  851. @ We need a function that will read in a word from the \.{PXL} file.  If
  852. the particular system
  853. @^system dependencies@>
  854. requires buffering, here is the place to do it.  It also sets a global flag
  855. |eof_pixel| when it reaches the end of the file.  If this flag is set on
  856. entrance to |load_pxl_file|, it is assumed that the file is bad.
  857.  
  858. @p function pixel_integer : integer ;
  859. var i:integer;
  860. begin i := pxl_file^ ;
  861. get(pxl_file) ;
  862. eof_pixel:=eof(pxl_file);
  863. pixel_integer:=i;
  864. end;
  865.  
  866. @ @<Glob...@>=
  867. @!eof_pixel:boolean;  {true when end of pixel file is reached.}
  868.  
  869. @ We also need a few routines to write data to the \.{PK} file.  We write
  870. data in 4-, 8-, 16-, 24-, and 32-bit chunks, so we define the appropriate
  871. routines. We must be careful not to let the sign bit mess us up, as some
  872. \PASCAL's implement division of a negative integer differently.  We define a
  873. constant to help us with the sign manipulations.
  874.  
  875. @<Const...@>=
  876. @!one_fourth=1073741824 ; {two to the thirtieth}
  877.  
  878. @ @p procedure pk_byte(b : integer) ;
  879. begin
  880. if b < 0 then b := b + 256 ;
  881. pk_file^ := b ;
  882. put(pk_file) ;
  883. incr(pk_loc) ;
  884. end ;
  885. @#
  886. procedure pk_halfword(a:integer) ;
  887. begin
  888.    if a < 0 then a := a + 65536 ;
  889.    pk_byte(a div 256) ;
  890.    pk_byte(a mod 256) ;
  891. end ;
  892. @#
  893. procedure pk_three_bytes(a:integer);
  894. begin
  895.    pk_byte(a div 65536 mod 256) ;
  896.    pk_byte(a div 256 mod 256) ;
  897.    pk_byte(a mod 256) ;
  898. end ;
  899. @#
  900. procedure pk_word(a:integer) ;
  901. var b : integer ;
  902. begin
  903.    if a < 0 then begin
  904.       a := a + one_fourth + one_fourth ;
  905.       b := 128 + a div 16777216 ;
  906.    end else b := a div 16777216 ;
  907.    pk_byte(b) ;
  908.    pk_byte(a div 65536 mod 256) ;
  909.    pk_byte(a div 256 mod 256) ;
  910.    pk_byte(a mod 256) ;
  911. end ;
  912. @#
  913. procedure pk_nyb(a:integer) ;
  914. begin
  915.    if bit_weight = 16 then begin
  916.       output_byte := a * 16 ;
  917.       bit_weight := 1 ;
  918.    end else begin
  919.       pk_byte(output_byte + a) ;
  920.       bit_weight := 16 ;
  921.    end ;
  922. end ;
  923.  
  924. @ We need the globals |bit_weight| and |output_byte| for buffering.
  925.  
  926. @<Glob...@>=
  927. @!bit_weight : integer ; {output bit weight}
  928. @!output_byte : integer ; {output byte for pk file}
  929.  
  930. @ Here is a procedure that reads the \.{PXL} file into memory, and sets the
  931. |dir_ptr| to the proper place.  It only checks that the first and last
  932. bytes of the file contain |pxl_id|.
  933.  
  934. @p procedure load_pxl_file ; {read in the pixel data}
  935. label 9997, {used for a bad format}
  936.   9999; {used for normal completion}
  937. var k:integer; {index for word moves}
  938. begin
  939.    open_pxl_file ;
  940.    k := 0 ;
  941.    if eof_pixel then goto 9997;
  942.    while not eof_pixel do begin
  943.       mem[k] := pixel_integer ;
  944.       k := k + 1 ;
  945.       if k > max_mem_size then
  946.          abort('PXtoPK memory size exceeded on load of pixel file!') ;
  947.    end ;
  948.    print_ln((4*k):1, ' bytes read from pixel file.') ;
  949.    if k + 10000 > max_mem_size then
  950.       abort('I don''t think that there will be enough memory.') ;
  951.    next_mem_free := k ;
  952.    k := k - 1 ;
  953.    if (mem[k] <> pxl_id) or (mem[0]<>pxl_id) then goto 9997 ;
  954.    goto 9999 ;
  955. 9997: abort('PXL file is bad');
  956. @.PXL file is bad@>
  957. 9999: dir_ptr := mem[k-1] ;
  958. end;
  959.  
  960. @ We need to declare the |mem| array and a few other variables.
  961.  
  962. @<Glob...@>=
  963. @!mem : array [0..max_mem_size] of integer ; {memory array}
  964. @!next_mem_free : integer ; {next memory location available}
  965. @!dir_ptr : integer ; {points to the directory of the pixel file}
  966.  
  967. @* Writing the packed file.
  968. Next we have some bit manipulation routines we need.
  969.  
  970. @p function hi(a:integer) : integer ;
  971. begin
  972.    hi := a div 65536 ;
  973. end ;
  974. @#
  975. function lo(a:integer) : integer ;
  976. begin
  977.    lo := a mod 65536 ;
  978. end ;
  979. @#
  980. function his(a:integer) : integer ;
  981. begin
  982.    if a < 0 then
  983.       his := ( a + one_fourth + one_fourth ) div 65536 - 32768
  984.    else
  985.       his := a div 65536 ;
  986. end ;
  987. @#
  988. function hip(a:integer) : integer ;
  989. begin
  990.    if a < 0 then
  991.       hip := ( a + one_fourth + one_fourth ) div 65536 + 32768
  992.    else
  993.       hip := a div 65536 ;
  994. end ;
  995. @#
  996. function lop(a:integer) : integer ;
  997. begin
  998.    lop := a - 65536 * his(a) ;
  999. end ;
  1000. @#
  1001. function los(a:integer) : integer ;
  1002. var b : integer ;
  1003. begin
  1004.    b := lop(a) ;
  1005.    if b > 32767 then
  1006.       los := b - 65536
  1007.    else
  1008.       los := b ;
  1009. end ;
  1010.  
  1011. @ We now need a few definitions to make access of the pixel file simpler.
  1012.  
  1013. @d x_size == hi(mem[dir_ptr]) {sizes}
  1014. @d y_size == lo(mem[dir_ptr])
  1015. @d x_offset == his(mem[dir_ptr+1]) {offsets}
  1016. @d y_offset == los(mem[dir_ptr+1])
  1017. @d raster_pointer == mem[dir_ptr+2] {raster pointer}
  1018. @d tfm_width == mem[dir_ptr+3] {tfm width}
  1019. @d checksum == mem[dir_ptr+512] {checksum at end of directory}
  1020. @d magnification == mem[dir_ptr+513]
  1021. @d design_size == mem[dir_ptr+514]
  1022.  
  1023. @ Now we write the preamble.  First, we must determine if we can use eight
  1024. bit sizes and offsets, or if we need sixteen bits.  Then, we simply copy
  1025. some data from the pixel file to the packed file.  Since pixel files are
  1026. assumed to be square, we simply write the horizontal magnification factor
  1027. out as the vertical magnification factor.
  1028.  
  1029. @d preamble_comment == 'PXTOPK 2.3 output'
  1030. @d comm_length = 17
  1031.  
  1032. @p procedure write_preamble ;
  1033. var
  1034.    i : integer ; {general purpose index}
  1035. begin
  1036.    open_pk_file ;
  1037.    pk_byte(pk_pre) ;
  1038.    pk_byte(pk_id) ;
  1039.    pk_byte(comm_length) ;
  1040.    for i := 1 to comm_length do pk_byte(xord[comment[i]]) ;
  1041.    pk_word(design_size) ; pk_word(checksum) ;
  1042.    pk_word(hppp) ; pk_word(hppp) ;
  1043. end ;
  1044.  
  1045. @ We define a few globals to maintain some of this data.
  1046.  
  1047. @<Glob...@>=
  1048. @!car : integer ; {a global character pointer}
  1049. @!hppp : integer ; {horizontal pixels per point}
  1050. @!comment : packed array [1..comm_length] of char ;
  1051.  
  1052. @ We initialize the comment array:
  1053.  
  1054. @<Set init...@>=
  1055. comment := preamble_comment ;
  1056.  
  1057. @ The write postamble procedure is very simple, having just to write the
  1058. |pk_post| command, followed by enough |pk_no_op|'s to make the file a
  1059. multiple of four bytes long.
  1060.  
  1061. @p procedure write_postamble ;
  1062. begin
  1063.    pk_byte(pk_post) ;
  1064.    while (pk_loc mod 4 <> 0) do pk_byte(pk_no_op) ;
  1065.    print_ln(pk_loc:1, ' bytes written to packed file.') ;
  1066. end ;
  1067.  
  1068. @* Packing and shipping character data.
  1069. Now we have the meat of the program---where we actually pack and send a
  1070. character to the |pk_file|.  First, we determine if we can use repeat
  1071. commands by looking for repeated raster rows that are not all zeros or
  1072. all ones.  Next, we create a list of bit counts in the |mem| array,
  1073. starting with white bits (if any) and continuing until the end of the
  1074. character.  We determine the length of the character in the packed form,
  1075. and compare it with the length in a bit-packed form, and send out the smaller
  1076. of the two.
  1077.  
  1078. @ First, we need a routine to compare two raster rows and tell us if they
  1079. are the same.
  1080.  
  1081. @p function equal(row1, row2: integer) : boolean ;
  1082. var i : integer ; {index}
  1083. temp : boolean ;
  1084. begin
  1085.    i := width ;
  1086.    temp := true ;
  1087.    while (i > 0) and temp do begin
  1088.       if mem[row1] <> mem[row2] then
  1089.          temp := false ;
  1090.       incr(row1) ; incr(row2) ;
  1091.       i := i - 32 ;
  1092.    end ;
  1093.    equal := temp ;
  1094. end ;
  1095.  
  1096. @ We now declare a few variables to contain the character width,
  1097. height, offsets, and raster pointer.
  1098.  
  1099. @<Glob...@>=
  1100. @!width : integer ; {width of current character}
  1101. @!height : integer ; {height of current character}
  1102. @!c_x_off : integer ; {x offset of current character}
  1103. @!c_y_off : integer ; {y offset of current character}
  1104.  
  1105. @ Now we supply the actual routine that compresses and ships the character.
  1106. We also calculate the horizontal escapement in pixels for the character here.
  1107. Since the pixel file format does not supply this information, we approximate
  1108. it like pixel-file reading drivers have to be rounding the \.{TFM} width.
  1109.  
  1110. @p procedure ship_character ;
  1111. var
  1112. @!c_raster : integer ; {pointer to raster data of character}
  1113. @!word_width : integer ; {width of character in 32-bit words}
  1114. @!comp_size : integer ; {size of compressed representation}
  1115. @!hor_esc : integer ; {horizontal escapement value}
  1116. @<Locals to |ship_character|@>
  1117. begin
  1118.    hor_esc := round(pxl_conv * tfm_width) ;
  1119.    width := x_size ; height := y_size ;
  1120.    c_x_off := x_offset ; c_y_off := y_offset ;
  1121.    c_raster := raster_pointer ;
  1122.    word_width := (width + 31) div 32 ;
  1123.    @<Create repeat list@> ;
  1124.    @<Create bit counts@> ;
  1125.    @<Calculate |dyn_f| and packed size and write character@> ;
  1126. end ;
  1127.  
  1128. @ The |pxl_conv| variable should be a global.
  1129.  
  1130. @<Glob...@>=
  1131. @!pxl_conv : real ; {converts TFM widths to pixels}
  1132.  
  1133. @ Our first task is to create the list of repeated raster rows.  To do this,
  1134. we first create a row of all zeros and a row of all ones to insure that we
  1135. do not flag on these.  Next, we simply walk through the raster representation,
  1136. looking for duplicates, and flag them as equal.  Finally, we walk through this
  1137. preliminary repeat list and add up all successive equal rows.
  1138.  
  1139. @<Create repeat list@>=
  1140. zero_row := next_mem_free ;
  1141. ones_row := next_mem_free + word_width ;
  1142. repeat_pointer := ones_row + word_width ;
  1143. bit_counts := repeat_pointer + height + 1 ;
  1144. for i := zero_row to ones_row - 1 do mem[i] := 0 ;
  1145. for i := ones_row to repeat_pointer - 2 do mem[i] := -1 ;
  1146. i := width mod 32 ;
  1147. if i = 0 then
  1148.    mem[repeat_pointer - 1] := -1
  1149. else if i = 1 then
  1150.    mem[repeat_pointer - 1] := - one_fourth - one_fourth
  1151. else
  1152.    mem[repeat_pointer - 1] := - power[32 - i] ;
  1153. i := 0 ;
  1154. j := height ;
  1155. while i < j do begin
  1156.    if equal(i*word_width+c_raster, zero_row) then
  1157.       mem[repeat_pointer + i] := 0
  1158.    else if equal(i*word_width+c_raster, ones_row) then
  1159.       mem[repeat_pointer + i] := 0
  1160.    else if i + 1 = j then
  1161.       mem[repeat_pointer + i] := 0
  1162.    else if equal(i*word_width+c_raster, (i+1)*word_width+c_raster) then
  1163.       mem[repeat_pointer + i] := 1
  1164.    else mem[repeat_pointer + i] := 0 ;
  1165.    incr(i) ;
  1166. end ;
  1167. i := 0 ;
  1168. while i < j do begin
  1169.    k := i ;
  1170.    while mem[repeat_pointer + k] = 1 do
  1171.       incr(k) ;
  1172.    mem[repeat_pointer + i] := k - i ;
  1173.    i := k + 1 ;
  1174. end ;
  1175. mem[repeat_pointer + i] := 0
  1176.  
  1177. @ Of course, we declare some of these locals.
  1178.  
  1179. @<Locals...@>=
  1180. i, j, k : integer ; {index variables}
  1181. @!zero_row : integer ; {points to the row of zeros}
  1182. @!ones_row : integer ; {points to the row of ones}
  1183. @!repeat_pointer : integer ; {points to the repeat list}
  1184. @!bit_counts : integer ; {points to the bit count list}
  1185. @!bits_smaller : boolean ; {indicates that bit mapping is shorter}
  1186. @!final_size : integer ; {final total size of character}
  1187.  
  1188. @ We also need the |power| array, which contains powers of two.
  1189.  
  1190. @<Glob...@>=
  1191. @!power : array [0..31] of integer ;
  1192.  
  1193. @ @<Set init...@>=
  1194. power[0] := 1 ;
  1195. for i := 1 to 30 do
  1196.    power[i] := power[i-1] * 2 ;
  1197. power[31] := - power[30] - power[30] ;
  1198.  
  1199. @ Now we scan the raster representation, skipping any rows which are
  1200. repeated from previous rows, and put this information in the |mem|
  1201. array starting after |bit_counts|.  A 0 terminates the list.  The
  1202. basic approach is quite simple, but first we need a few definitions
  1203. to make the type of bit returned more readable.
  1204.  
  1205. @d black = 1
  1206. @d white = 0
  1207. @d end_of_glyph = 2
  1208.  
  1209. @ And now the actual routine.
  1210.  
  1211. @<Create bit counts@>=
  1212. repeat_flag := 0 ;
  1213. bit_ptr := width - 1 ;
  1214. cur_repeat := repeat_pointer ;
  1215. end_raster := c_raster + height * word_width ;
  1216. cur_ptr := bit_counts ;
  1217. count := 0 ;
  1218. test := white ;
  1219. repeat
  1220.    @<Get bit, skipping repeated rows@> ;
  1221.    if bit = test then
  1222.       incr(count)
  1223.    else begin
  1224.       mem[cur_ptr] := count ;
  1225.       incr(cur_ptr) ;
  1226.       if cur_ptr + 3 > max_mem_size then
  1227.          abort('Out of memory while saving character counts!') ;
  1228.       count := 1 ;
  1229.       test := bit ;
  1230.       if repeat_flag > 0 then begin
  1231.          mem[cur_ptr] := - repeat_flag ;
  1232.          repeat_flag := 0 ;
  1233.          incr(cur_ptr) ;
  1234.       end ;
  1235.    end ;
  1236. until test = end_of_glyph ;
  1237. mem[cur_ptr] := 0 ;
  1238. mem[cur_ptr+1] := 0
  1239.  
  1240. @ Of course, there is still that get bit macro that needs to be defined.
  1241. We simply pull the bits off one by one, checking the repeat flag and end
  1242. of glyph.
  1243.  
  1244. @<Get bit, skipping repeated rows@>=
  1245. incr(bit_ptr) ;
  1246. if bit_ptr = width then begin
  1247.    bit_mod_32 := 0 ;
  1248.    bit_ptr := 0 ;
  1249.    if mem[cur_repeat] > 0 then begin
  1250.       repeat_flag := mem[cur_repeat] ;
  1251.       cur_repeat := cur_repeat + repeat_flag ;
  1252.       c_raster := c_raster + word_width * repeat_flag ;
  1253.    end ;
  1254.    incr(cur_repeat) ;
  1255. end ;
  1256. decr(bit_mod_32) ;
  1257. if bit_mod_32 = -1 then begin
  1258.    bit_mod_32 := 31 ;
  1259.    word := mem[c_raster] ;
  1260.    incr(c_raster) ;
  1261. end ;
  1262. if c_raster > end_raster then
  1263.    bit := end_of_glyph
  1264. else if bit_mod_32 = 31 then begin
  1265.    if word < 0 then begin
  1266.       bit := black ;
  1267.       word := word + one_fourth + one_fourth ;
  1268.    end else
  1269.       bit := white ;
  1270. end else begin
  1271.    if word >= power[bit_mod_32] then begin
  1272.       word := word - power[bit_mod_32] ;
  1273.       bit := black ;
  1274.    end else
  1275.       bit := white ;
  1276. end
  1277.  
  1278. @ Now for all of those many locals used but not defined:
  1279.  
  1280. @<Locals...@>=
  1281. @!count : integer ; {counts the number of bits}
  1282. @!test : integer ; {what bits we are counting}
  1283. @!cur_ptr : integer ; {where to put the counts}
  1284. @!bit : integer ; {a variable to return the type of bit}
  1285. @!repeat_flag : integer ; {indicates this row is to be repeated.}
  1286. @!word : integer ; {current word to extract bits from}
  1287. @!bit_ptr : integer ; {a bit counter in horizontal bits}
  1288. @!bit_mod_32 : integer ; {the power of two to look for}
  1289. @!cur_repeat : integer ; {index into repeat array}
  1290. @!end_raster : integer ; {the end of the character raster representation}
  1291.  
  1292. @ Here is another piece of rather intricate code.  Here we determine the
  1293. smallest size in which we can pack the data, calculating |dyn_f| in the
  1294. process.  To do this, we calculate the size required if |dyn_f| is 0, and put
  1295. this in |comp_size|.  Then, we calculate the changes in the size for each
  1296. increment of |dyn_f|, and stick these values in the |deriv| array.  Finally,
  1297. we scan through this array, and find the final minimum value, which we then
  1298. use to send the character data.
  1299.  
  1300. @<Calculate |dyn_f| and packed size and write character@>=
  1301. for i := 1 to 13 do deriv[i] := 0 ;
  1302. first_on := mem[bit_counts] = 0 ;
  1303. if first_on then incr(bit_counts) ;
  1304. i := bit_counts ;
  1305. comp_size := 0 ;
  1306. while mem[i] <> 0 do
  1307.    @<Process count for best |dyn_f| value@> ;
  1308. b_comp_size := comp_size ;
  1309. dyn_f := 0 ;
  1310. for i := 1 to 13 do begin
  1311.    comp_size := comp_size + deriv[i] ;
  1312.    if comp_size <= b_comp_size then begin
  1313.       b_comp_size := comp_size ;
  1314.       dyn_f := i ;
  1315.    end ;
  1316. end ;
  1317. comp_size := (b_comp_size + 1) div 2 ;
  1318. if (comp_size > (height * width + 7) div 8) or (height * width = 0) then begin
  1319.    comp_size := (height * width + 7) div 8 ;
  1320.    dyn_f := 14 ;
  1321. end ;
  1322. @<Write character preamble@> ;
  1323. if dyn_f <> 14 then
  1324.    @<Send compressed format@>
  1325. else
  1326.    @<Send bit map@> ;
  1327. if pred_pk_loc <> pk_loc then
  1328.    abort('Bad predicted character length: character ',car:1)
  1329.  
  1330. @ When we enter this module, we have a count, at |mem[i]|.  First, we add to
  1331. the |comp_size| the number of
  1332. nybbles that this count would require, assuming |dyn_f| to be zero.  Since when
  1333. |dyn_f| is zero, there are no one nybble counts, we simply check the two-nybble
  1334. counts, and then the extensible counts.
  1335.  
  1336. Next, we take the count value and determine the value of |dyn_f| (if any) that
  1337. would cause this count to take either more or less nybbles.  If a valid value
  1338. for |dyn_f| exists in this range, we accumulate this change in the |deriv|
  1339. array.
  1340.  
  1341. We know that a repeat count of one will not change the length of the raster
  1342. representation, no matter what |dyn_f| is, because it is always represented
  1343. by the nybble 15, so we do that as a special case.
  1344.  
  1345. @<Process count for best |dyn_f| value@>=
  1346. begin
  1347.    j := mem[i] ;
  1348.    if j = -1 then incr(comp_size)
  1349.    else begin
  1350.       if j < 0 then begin
  1351.          incr(comp_size) ;
  1352.          j := - j ;
  1353.       end ;
  1354.       if j < 209 then comp_size := comp_size + 2
  1355.       else begin
  1356.          k := j - 193 ;
  1357.          while k >= 16 do begin
  1358.             k := k div 16 ;
  1359.             comp_size := comp_size + 2 ;
  1360.          end ;
  1361.          comp_size := comp_size + 1 ;
  1362.       end ;
  1363.       if j < 14 then decr(deriv[j])
  1364.       else if j < 209 then incr(deriv[(223 - j) div 15])
  1365.       else begin
  1366.          k := 16 ;
  1367.          while ( k * 16 < j + 3 ) do k := k * 16 ;
  1368.          if j-k <= 192 then deriv[(207-j+k) div 15] := deriv[(207-j+k) div 15]
  1369.             + 2 ;
  1370.        end ;
  1371.    end ;
  1372.    incr(i) ;
  1373. end
  1374.  
  1375. @ We need a handful of locals:
  1376.  
  1377. @<Locals to |ship_character|@>=
  1378. @!dyn_f : integer ; {packing value}
  1379. @!deriv : array[1..13] of integer ; {derivative}
  1380. @!b_comp_size : integer ; {best size}
  1381. @!first_on : boolean ; {indicates that the first bit is on}
  1382. @!flag_byte : integer ; {flag byte for character}
  1383. @!state : boolean ; {state variable}
  1384. @!on : boolean ; {white or black?}
  1385.  
  1386. @ Now we write the character preamble information.  First we need to determine
  1387. which of the three formats we should use.
  1388.  
  1389. @<Write character preamble@>=
  1390. flag_byte := dyn_f * 16 ;
  1391. if first_on then flag_byte := flag_byte + 8 ;
  1392. if (tfm_width > 16777215) or (tfm_width < 0) or
  1393.       (hor_esc < 0) or (comp_size > 196579) or (width > 65535) or
  1394.       (height > 65535) or (c_x_off > 32767) or (c_y_off > 32767) or
  1395.       (c_x_off < -32768) or (c_y_off < -32768) then
  1396.    @<Write long character preamble@>
  1397. else if (hor_esc > 255) or (width > 255) or (height > 255) or
  1398.       (c_x_off > 127) or (c_y_off > 127) or (c_x_off < -128) or
  1399.       (c_y_off < -128) or (comp_size > 1016) then
  1400.    @<Write two-byte short character preamble@>
  1401. else
  1402.    @<Write one-byte short character preamble@>
  1403.  
  1404. @ Here we have determined that we must write a long character preamble.  We
  1405. adjust a few parameters, and then must write the data.
  1406.  
  1407. @<Write long character preamble@>=
  1408. begin
  1409.    flag_byte := flag_byte + 7 ;
  1410.    pk_byte(flag_byte) ;
  1411.    comp_size := comp_size + 28 ;
  1412.    pk_word(comp_size) ;
  1413.    pk_word(car) ;
  1414.    pred_pk_loc := pk_loc + comp_size ;
  1415.    pk_word(tfm_width) ;
  1416.    pk_word(hor_esc * 65536) ;
  1417.    pk_word(0) ;
  1418.    pk_word(width) ;
  1419.    pk_word(height) ;
  1420.    pk_word(c_x_off) ;
  1421.    pk_word(c_y_off) ;
  1422. end
  1423.  
  1424. @ Here we write a short short character preamble, with one-byte size
  1425. parameters.
  1426.  
  1427. @<Write one-byte short character preamble@>=
  1428. begin
  1429.    comp_size := comp_size + 8 ;
  1430.    flag_byte := flag_byte + comp_size div 256 ;
  1431.    pk_byte(flag_byte) ;
  1432.    pk_byte(comp_size mod 256) ;
  1433.    pk_byte(car) ;
  1434.    pred_pk_loc := pk_loc + comp_size ;
  1435.    pk_three_bytes(tfm_width) ;
  1436.    pk_byte(hor_esc) ;
  1437.    pk_byte(width) ;
  1438.    pk_byte(height) ;
  1439.    pk_byte(c_x_off) ;
  1440.    pk_byte(c_y_off) ;
  1441. end
  1442.  
  1443. @ Here we write a long short character preamble, with two-byte size parameters.
  1444.  
  1445. @<Write two-byte short character preamble@>=
  1446. begin
  1447.    comp_size := comp_size + 13 ;
  1448.    flag_byte := flag_byte + comp_size div 65536 + 4 ;
  1449.    pk_byte(flag_byte) ;
  1450.    pk_halfword(comp_size mod 65536) ;
  1451.    pk_byte(car) ;
  1452.    pred_pk_loc := pk_loc + comp_size ;
  1453.    pk_three_bytes(tfm_width) ;
  1454.    pk_halfword(hor_esc) ;
  1455.    pk_halfword(width) ;
  1456.    pk_halfword(height) ;
  1457.    pk_halfword(c_x_off) ;
  1458.    pk_halfword(c_y_off) ;
  1459. end
  1460.  
  1461. @ At this point, we have decided that the run-encoded format is smaller.  (This
  1462. is almost always the case.)  We send out the data, a nybble at a time.
  1463.  
  1464. @<Send compressed format@>=
  1465. begin
  1466.    bit_weight := 16 ;
  1467.    max_2 := 208 - 15 * dyn_f ;
  1468.    i := bit_counts ;
  1469.    while mem[i] <> 0 do begin
  1470.       j := mem[i] ;
  1471.       if j = -1 then
  1472.          pk_nyb(15)
  1473.       else begin
  1474.          if j < 0 then begin
  1475.             pk_nyb(14) ;
  1476.             j := - j ;
  1477.          end ;
  1478.          if j <= dyn_f then pk_nyb(j)
  1479.          else if j <= max_2 then begin
  1480.             j := j - dyn_f - 1 ;
  1481.             pk_nyb(j div 16 + dyn_f + 1) ;
  1482.             pk_nyb(j mod 16) ;
  1483.          end else begin
  1484.             j := j - max_2 + 15 ;
  1485.             k := 16 ;
  1486.             while k <= j do begin
  1487.                k := k * 16 ;
  1488.                pk_nyb(0) ;
  1489.             end ;
  1490.             while k > 1 do begin
  1491.                k := k div 16 ;
  1492.                pk_nyb(j div k) ;
  1493.                j := j mod k ;
  1494.             end ;
  1495.          end ;
  1496.       end ;
  1497.       incr(i) ;
  1498.    end ;
  1499.    if bit_weight <> 16 then pk_byte(output_byte) ;
  1500. end
  1501.  
  1502. @ This macro is for the case where we have decided to send the character raster
  1503. packed bit-wise.  It uses the bit counts as well, sending eight at a time.
  1504. Here we have a miniature packed format interpreter, as we must repeat any rows
  1505. that are repeated.  The algorithm to do this was a lot of fun to generate.  Can
  1506. you figure out how it works?
  1507.  
  1508. @<Send bit map@>=
  1509. begin
  1510.    buff := 0 ;
  1511.    p_bit := 8 ;
  1512.    i := bit_counts ;
  1513.    h_bit := width ;
  1514.    on := not first_on ;
  1515.    state := false ;
  1516.    count := 0 ;
  1517.    repeat_flag := 0 ;
  1518.    while ( mem[i] <> 0 ) or state or ( count > 0 ) do begin
  1519.       if state then begin
  1520.          count := r_count ; i := r_i ; on := r_on ;
  1521.          decr(repeat_flag) ;
  1522.       end else begin
  1523.          r_count := count ; r_i := i ; r_on := on ;
  1524.       end ;
  1525.       @<Send one row by bits@> ;
  1526.       if state and ( repeat_flag = 0 ) then begin
  1527.          count := s_count ; i := s_i ; on := s_on ;
  1528.          state := false ;
  1529.       end else if not state and ( repeat_flag > 0 ) then begin
  1530.          s_count := count ; s_i := i ; s_on := on ;
  1531.          state := true ;
  1532.       end ;
  1533.    end ;
  1534.    if p_bit <> 8 then pk_byte(buff) ;
  1535. end
  1536.  
  1537. @ All of the remaining locals:
  1538.  
  1539. @<Locals to |ship_character|@>=
  1540. @!h_bit : integer ; {what bit in the character are we on?}
  1541. @!p_bit : integer ; {what bit are we about to send out?}
  1542. @!r_on, @!s_on : boolean ; {state saving variables}
  1543. @!r_count, @!s_count : integer ; {ditto}
  1544. @!r_i, @!s_i : integer ; {and again.}
  1545. @!max_2 : integer ; {the highest count that fits in two bytes}
  1546. @!pred_pk_loc : integer ; {where we think the character will end}
  1547. @!buff : integer ; {buffer for byte output}
  1548.  
  1549. @ We are at the beginning of a row; we simply output the next |width| bits.
  1550. We break the possibilities up into three cases; we finish a byte but not
  1551. the row, we finish a row, and we finish neither a row nor a byte.  But,
  1552. first, we insure that we have a |count| value.
  1553.  
  1554. @<Send one row by bits@>=
  1555. repeat
  1556.    if count = 0 then begin
  1557.       if mem[i] < 0 then begin
  1558.          if not state then repeat_flag := - mem[i] ;
  1559.          incr(i) ;
  1560.       end ;
  1561.       count := mem[i] ;
  1562.       incr(i) ;
  1563.       on := not on ;
  1564.    end ;
  1565.    if ( count >= p_bit ) and ( p_bit < h_bit ) then begin
  1566. { we end a byte, we don't end the row }
  1567.       if on then buff := buff + power[p_bit] - 1 ;
  1568.       pk_byte(buff) ; buff := 0 ;
  1569.       h_bit := h_bit - p_bit ; count := count - p_bit ; p_bit := 8 ;
  1570.    end else if ( count < p_bit ) and ( count < h_bit ) then begin
  1571. { we end neither the row nor the byte }
  1572.       if on then buff := buff + power[p_bit] - power[p_bit - count] ;
  1573.       p_bit := p_bit - count ; h_bit := h_bit - count ; count := 0 ;
  1574.    end else begin
  1575. { we end a row and maybe a byte }
  1576.       if on then buff := buff + power[p_bit] - power[p_bit - h_bit] ;
  1577.       count := count - h_bit ; p_bit := p_bit - h_bit ; h_bit := width ;
  1578.       if p_bit = 0 then begin
  1579.          pk_byte(buff) ; buff := 0 ; p_bit := 8 ;
  1580.       end ;
  1581.    end ;
  1582. until h_bit = width
  1583.  
  1584. @* Terminal communication.
  1585. We must get the file names and determine whether output is to be in
  1586. hexadecimal or binary.  To do this, we use the standard input path
  1587. name.  We need a procedure to flush the input buffer.  For most systems,
  1588. this will be an empty statement.  For other systems, a |print_ln| will
  1589. provide a quick fix.  We also need a routine to get a line of input from
  1590. the terminal.  On some systems, a simple |read_ln| will do.  Finally,
  1591. a macro to print a string to the first blank is required.
  1592.  
  1593. @d flush_buffer == begin end
  1594. @d get_line(#) == if eoln(input) then read_ln(input) ;
  1595.    i := 1 ;
  1596.    while not (eoln(input) or eof(input)) do begin
  1597.       #[i] := input^ ;
  1598.       incr(i) ;
  1599.       get(input) ;
  1600.    end ;
  1601.    #[i] := ' '
  1602.  
  1603. @ @p procedure dialog ;
  1604. var i : integer ; {index variable}
  1605. buffer : packed array [1..name_length] of char; {input buffer}
  1606. begin
  1607.    for i := 1 to name_length do begin
  1608.       pxl_name[i] := ' ' ;
  1609.       pk_name[i] := ' ' ;
  1610.    end;
  1611.    print('Input file name:  ') ;
  1612.    flush_buffer ;
  1613.    get_line(pxl_name) ;
  1614.    print('Output file name:  ') ;
  1615.    flush_buffer ;
  1616.    get_line(pk_name) ;
  1617.    print_ln(' ') ;
  1618. end ;
  1619.  
  1620. @* The main program.
  1621. Now that we have all the pieces written, let us put them together.
  1622.  
  1623. @p begin
  1624. initialize ;
  1625. dialog ;
  1626. load_pxl_file ;
  1627. pxl_conv := ( design_size div 16 ) / 65536.0 * magnification / 72.27
  1628.     / 5242880.0 ;
  1629. hppp := round(magnification * 65536 / 72.27 / 5) ;
  1630. write_preamble ;
  1631. for car := 0 to 127 do begin
  1632.    if raster_pointer <> 0 then
  1633.       ship_character ;
  1634.    dir_ptr := dir_ptr + 4 ;
  1635. end ;
  1636. write_postamble ;
  1637. final_end :
  1638. end .
  1639.  
  1640. @* System-dependent changes.
  1641. This section should be replaced, if necessary, by changes to the program
  1642. that are necessary to make \.{PXtoPK} work at a particular installation.
  1643. Any additional routines should be inserted here.
  1644. @^system dependencies@>
  1645.  
  1646. @* Index.
  1647. Pointers to error messages appear here together with the section numbers
  1648. where each ident\-i\-fier is used.